home *** CD-ROM | disk | FTP | other *** search
/ Over 1,000 Windows 95 Programs / Over 1000 Windows 95 Programs (Microforum) (Disc 1).iso / 1134 / irisname.tx_ / irisname
Text File  |  1996-07-25  |  3KB  |  63 lines

  1. 1. Title: Iris Plants Database
  2.  
  3. 2. Sources:
  4.      (a) Creator: R.A. Fisher
  5.      (b) Donor: Michael Marshall (MARSHALL%PLU@io.arc.nasa.gov)
  6.      (c) Date: July, 1988
  7.  
  8. 3. Past Usage:
  9.    - Publications: too many to mention!!!  Here are a few.
  10.    1. Fisher,R.A. "The use of multiple measurements in taxonomic problems"
  11.       Annual Eugenics, 7, Part II, 179-188 (1936); also in "Contributions
  12.       to Mathematical Statistics" (John Wiley, NY, 1950).
  13.    2. Duda,R.O., & Hart,P.E. (1973) Pattern Classification and Scene Analysis.
  14.       (Q327.D83) John Wiley & Sons.  ISBN 0-471-22361-1.  See page 218.
  15.    3. Dasarathy, B.V. (1980) "Nosing Around the Neighborhood: A New System
  16.       Structure and Classification Rule for Recognition in Partially Exposed
  17.       Environments".  IEEE Transactions on Pattern Analysis and Machine
  18.       Intelligence, Vol. PAMI-2, No. 1, 67-71.
  19.       -- Results:
  20.          -- very low misclassification rates (0% for the setosa class)
  21.    4. Gates, G.W. (1972) "The Reduced Nearest Neighbor Rule".  IEEE 
  22.       Transactions on Information Theory, May 1972, 431-433.
  23.       -- Results:
  24.          -- very low misclassification rates again
  25.    5. See also: 1988 MLC Proceedings, 54-64.  Cheeseman et al's AUTOCLASS II
  26.       conceptual clustering system finds 3 classes in the data.
  27.  
  28. 4. Relevant Information:
  29.    --- This is perhaps the best known database to be found in the pattern
  30.        recognition literature.  Fisher's paper is a classic in the field
  31.        and is referenced frequently to this day.  (See Duda & Hart, for
  32.        example.)  The data set contains 3 classes of 50 instances each,
  33.        where each class refers to a type of iris plant.  One class is
  34.        linearly separable from the other 2; the latter are NOT linearly
  35.        separable from each other.
  36.    --- Predicted attribute: class of iris plant.
  37.    --- This is an exceedingly simple domain.
  38.  
  39. 5. Number of Instances: 150 (50 in each of three classes)
  40.  
  41. 6. Number of Attributes: 4 numeric, predictive attributes and the class
  42.  
  43. 7. Attribute Information:
  44.    1. sepal length in cm
  45.    2. sepal width in cm
  46.    3. petal length in cm
  47.    4. petal width in cm
  48.    5. class: 
  49.       -- Iris Setosa
  50.       -- Iris Versicolour
  51.       -- Iris Virginica
  52.  
  53. 8. Missing Attribute Values: None
  54.  
  55. Summary Statistics:
  56.              Min  Max   Mean    SD   Class Correlation
  57.    sepal length: 4.3  7.9   5.84  0.83    0.7826   
  58.     sepal width: 2.0  4.4   3.05  0.43   -0.4194
  59.    petal length: 1.0  6.9   3.76  1.76    0.9490  (high!)
  60.     petal width: 0.1  2.5   1.20  0.76    0.9565  (high!)
  61.  
  62. 9. Class Distribution: 33.3% for each of 3 classes.
  63.